CTR-DB数据库(http://ctrdb.ncpsb.org.cn/home)于2022年1月份发布在Nucleic Acids Research杂志,数据库整合化疗药物治疗前83个肿瘤患者转录组数据集,涵盖28种肿瘤类型、123种药物和5139个组织样本,提供药物应答反应信息,同时支持表达差异分析、ROC曲线、功能富集、致敏药物检索和肿瘤免疫微环境分析等单个数据集探索,以及多数据集联合分析、比较分析等功能,为耐药机制、耐药生物标志物探索、药物组合分析和耐药机制异质性等研究提供极大便利。
菜单栏Help部分为数据库介绍及使用指南,大家可以随时查阅。
▌数据库核心功能及操作演示
1
Browse模块
Browse模块支持以数据集、药物、肿瘤类型和基因进行数据浏览,以及单个数据集探索性分析。
以Dataset部分为例,依次选择药物类型、药物名称及肿瘤类型,再限定样本量和数据类型,进而筛选感兴趣的数据集。与乳腺癌氟尿嘧啶(Fluorouracil)化疗数据集为例,结果有48个CTR-DB数据集,以第一条即TFAC方案对应的数据集为例,其CTR-DB ID为CTR_Microarray_48,打勾后点击上方Download selected files可下载数据集,提供表达谱和临床信息。
点击CTR-DB ID列蓝色字体CTR_Microarray_48进入详情页面。Basic Information部分提供CTR_Microarray_48源数据集信息,TFAC方案四种药物及靶基因信息。
Analysis Results部分为单个数据集探索性分析结果,Result1:Resistance signature analysis部分为耐药特征分析,Result2:Tumor microenvironment analysis为肿瘤微环境分析。
Result1:Resistance signature analysis部分,设置Adjust P和|logFC|阈值,点击GO获得分析结果,首先是DEG即表达差异分析结果,以火山图和热图形式展示,具体基因展示在下方表格。
表格提供基因Gene symbol、Entrez ID、LogFC及对应的P value和Adjust p value、AUC及对应的P value和Adjust p value,以及肿瘤敏感和肿瘤耐药组表达差异箱图,还有AUC曲线图。
点击蓝色基因名BTG3,跳转至Gene目录下基因详细信息页面,提供BTG3交互蛋白信息,靶向调节BTG3的miRNA和转录因子信息,以及功能注释信息。还提供BTG3作为肿瘤耐药生物标志物的探索性分析结果,提示乳腺癌中BTG3基因可以作为TFAC方案耐药的biomarker,即BTG3低表达乳腺癌患者对TFAC方案治疗耐药。
返回上级目录,再看GSEA分析,提供上述表达差异基因功能注释结果,支持6种基因集,包括KEGG、Hallmark、Reactome、WikiPathways和MicroRNA靶基因及来自MSigDB数据库的转录因子靶基因。根据调整后P值递增顺序以条形图展示Top10上调基因组(NES>1)和Top10下调基因组(NES<-1),通常|NES|≥1和调整P值≤0.05的基因集值得关注。下方表格提供详细信息。
Over-representation analysis (ORA)分析结果与GSEA分析结果类似。
接下来是基于L1000CDS²系统分析获得的可以逆转上述耐药基因表达特征的潜在药物信息,相关药物可能是用于治疗TFAC方案耐药的乳腺癌患者的候选药物。
Result2:Tumor microenvironment analysis部分为基于estimate和MCPcounter包肿瘤免疫浸润分析结果,以热图形式展示。下方表格提供表达差异及ROC曲线信息。
Browse模块Drug功能较为简单,检索框输入或侧边栏选择感兴趣药物,即可获得药物基本信息,提供基于DrugBank数据库的药物靶基因信息。
Browse模块Cancer功能同样可以检索或选择感兴趣的肿瘤进行数据浏览,点击结果中Dataset number跳转至Dataset目录查看数据集。
2
Combine模块
Combine模块可以组合现有的CTR-DB数据集进行肿瘤耐药特征分析和肿瘤免疫微环境分析,“组合”的含义,可以是指定药物应答和耐药分组进行探索性分析,或是将不同来源具有相同治疗方案和肿瘤或肿瘤亚型的样本进行组合以获得更大的样本量,或是合并一类药物(如PD-1/PD-L1抑制剂、激酶抑制剂)或某类肿瘤的亚型等。
左侧栏供选择感兴趣的数据集,以Example数据进行演示,包含1个药物应答数据集和3个耐药数据集,Original response grouping列为药物应答信息,各个缩写的含义在Help帮助文档有说明,需要注意一些不能组合分析的情况。
点击Submit获得分析结果,Basic Information部分展示上述4个数据集,可见自定义的药物应答和耐药分组,Combine Analysis分析结果与前述类似,不再赘述。
3
Compare模块
Compare模块可以选择多个CTR-DB数据集结果进行meta分析,旨在探索不同的患者队列之间耐药机制的异质性和同质性,甚至发现潜在pan-cancer或pan-drug相关耐药机制和耐药性生物标志物。Compare分析结果有基因表达差异分析、ROC曲线、肿瘤微环境(TME)指数及相关ROC曲线、KEGG富集分析。该功能仅限于样本量在10以上且药物应答样本数大于1的CTR-DB数据集。Meta分析基于metaP包实现,要求请选择至少2个CTR-DB数据集。
左侧栏供选择感兴趣的数据集,以Example数据进行演示,包含Anthracycline+Taxane1方案治疗的1个三阴性乳腺癌和1个乳腺癌数据集。
结果Gene AUC部分,热图展示上述2个数据集共有的耐药特征基因在两个数据集中的AUC值,以及Meta分析结果,结果中较小的meta-P值意味着该基因在多个数据集中的耐药特征具有显著一致性。同理,对于其他结果,即Gene LogFC、Tumor microenvironment AUC、Tumor microenvironment logFC和KEGG ENS,结果中小的meta-P值表明潜在的“泛数据集”耐药机制。
4
Biomarker validation模块
Biomarker validation模块即上述Browse模块下Gene功能,用于感兴趣基因的肿瘤耐药特征分析,以RFC2为例点击查看详情,基本与前述类似,不再赘述。
总结
CTR-DB数据库数据库整合28种肿瘤药物治疗相关转录组数据集,提供药物应答反应信息,支持表达差异分析、ROC曲线、功能富集、致敏药物检索和肿瘤免疫微环境分析等单个数据集探索,以及多数据集联合分析、比较分析等功能,为耐药机制、耐药生物标志物探索、药物组合分析和耐药机制异质性等研究提供极大便利。
以上就是CTR-DB数据库全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下文献哦~!
文章来源:挑圈联盟